机器学习 | 陶旭辉、郭峰——异质性政策效应评估与机器学习方法:研究进展与未来方向
概要
💡 本次推荐的文章《异质性政策效应评估与机器学习方法:研究进展与未来方向》,发表在《管理世界》2023年第11期上,作者是陶旭辉和郭峰。(👉点击查看文章详情)
这篇论文探讨了在大数据时代背景下,如何利用机器学习方法来评估公共政策的异质性效应。文章首先强调了准确评估公共政策的重要性,这对于制定科学政策和提升国家治理体系现代化至关重要。随后,论文指出传统的异质性政策效应评估方法在大数据时代面临挑战,如难以处理高维数据、难以全面分析多重异质性问题等。
文章的核心部分介绍了机器学习在异质性政策效应评估中的应用,包括如何更好地筛选和切分异质性变量、评估多重异质性政策效应以及估计个体政策效应。这些应用利用了机器学习的数据驱动特性和预测能力,为政策评估提供了新的视角和工具。
然而,论文也指出了机器学习在异质性政策效应评估中的局限性,如算法的可解释性、过程的可检验性以及结论的稳健性。为了克服这些局限性,文章提出了未来研究的方向,包括发展机器学习方法、结合传统分析范式、规范数据采集和处理流程,以及推动数据和代码的公开透明。
总的来说,这篇论文为公共政策研究者提供了一个框架,以理解和利用机器学习技术来更有效地评估政策的异质性效应,从而为政策制定提供更精确的指导。主要内容
这篇文章主要分为以下几个部分,每一部分的主要内容如下:
1. 引言:
强调了公共政策评估的重要性,特别是在大数据时代背景下,异质性政策效应评估的必要性。
2. 异质性政策效应评估的价值和传统方法介绍:
“关于异质性政策效应评估的研究很多,譬如低技能者相比高技能者在求职培训中可能获益更多(克瑙斯 等,2022);小户型住房相比大户型住房在地铁开通后可能更具有升值空间(承佑等,2018);规模大的 P2P 网络借贷平台交易量更易受到新闻文本情绪影响(沈艳、王靖一,2021)。异质性政策效应评估越来越得到各界广泛的关注,从废除科举的社会效应(郝等,2022)到失业保险的经济后果(柴提,2008),从农村电子商务推广(科 图雷等,2021)到城市经济学的户口价值评估(陈等,2019),从精准医疗(田等,2014)到定制营销建议(阿斯卡 尔萨,2018),政策制定者都需要了解政策在不同群体中产生的异质性政策效应。总结而言,异质性政策效应评估具有以下几方面的价值。
首先,关于异质性政策效应评估的重要性,文章提到了几点。第一,异质性政策效应评估可以帮助我们验证政策效应的解释机制。例如,通过评估不同群体的政策效应,我们可以了解政策效果的作用机理,验证理论预测,或排除一些竞争性解释。第二,异质性政策效应评估可以提供差别化的政策处理依据。例如,通过了解政策在不同群体中的效果,我们可以为政策制定者提供更细致的信息,帮助他们制定更有针对性的政策,从而实现资源的最优配置。
接下来,文章介绍了两种传统的异质性政策效应评估方法:交互项分析和分组回归分析。交互项分析是直接在模型中引入政策变量和异质性变量的交互项,以考察政策效应的异质性。分组回归分析则是根据异质性变量的取值将样本分为不同的组,然后对每个组进行回归分析,以考察组间政策效应的差异。
然而,这两种方法都存在一定的局限性。首先,它们无法有效地处理多重异质性问题,即当政策效应受多个异质性变量影响时,传统方法难以全面考虑这些变量之间的交互作用。其次,传统方法在处理高维数据时效果不佳,容易受到“维度诅咒”的影响。最后,传统方法难以有效地评估个体政策效应,即针对每个个体的政策效果。
总的来说,传统方法在异质性政策效应评估中发挥了重要作用,但随着大数据时代的到来,这些方法在处理高维数据、多重异质性等问题时显得力不从心,因此需要引入新的方法,如机器学习方法,来改进异质性政策效应评估。
3. 大数据背景下传统异质性政策效应评估方法存在的问题:
首先,大数据时代的到来为政策效应评估提供了全新的素材。大数据包含了丰富的信息,如文本数据、图像数据、音频数据等,这些数据提供了传统数据无法比拟的细节和信息。然而,大数据的高维、非结构化等特点也给政策效应评估带来了新的挑战。传统的统计方法主要是为处理低维、结构化的数据设计的,在处理高维、非结构化的大数据时,将面临“维度诅咒”的问题,即模型估计的准确性和稳定性将大幅下降。
其次,大数据时代对异质性政策效应评估提出了更高的要求。在传统研究中,我们关注的是政策的平均效应,但在大数据时代,我们不仅要关注平均效应,还要关注针对不同群体、甚至是个体层面的政策效应。这就需要我们的评估方法能够处理高维数据,进行精细化的评估。然而,传统的交互项分析和分组回归等方法难以满足这一需求。
最后,大数据时代对政策效应评估的范式也提出了新的要求。在大数据背景下,研究者需要更多地依赖数据驱动的方法,而不仅仅是理论驱动。传统的异质性政策效应评估方法主要以理论为导向,难以应对大数据带来的挑战。
总的来说,大数据时代对传统异质性政策效应评估方法提出了新的要求,这些方法在处理高维数据、进行精细化评估等方面存在局限性。因此,需要引入新的方法,如机器学习方法,以应对大数据时代的挑战。
4. 机器学习在异质性政策效应评估中的优势与应用:
首先,关于机器学习在异质性政策效应评估中的优势,文章提到了几点。第一,机器学习是一种数据驱动的方法,它不需要预先设定的模型,而是通过从数据中学习来建立模型。这使得机器学习在处理高维数据、非线性关系等问题时具有优势。第二,机器学习具有预测能力,可以用于评估个体政策效应。这是传统方法难以做到的。
接下来,文章详细讨论了机器学习在异质性政策效应评估中的应用。第一,机器学习可以更好地筛选和切分异质性变量。例如,Lasso回归可以用于筛选重要的异质性变量,树模型可以用于确定变量的最佳切分点。第二,机器学习可以更好地评估多重异质性政策效应。例如,树模型可以处理多个异质性变量之间的交互作用,评估政策效应的多重异质性。第三,机器学习可以更好地评估个体政策效应。例如,因果森林和深度学习可以用于估计个体层面的政策效应。
总的来说,机器学习在异质性政策效应评估中具有明显的优势,它可以处理高维数据,评估多重异质性,预测个体政策效应,这些都是传统方法难以做到的。因此,机器学习为异质性政策效应评估提供了新的可能。
5. 机器学习在异质性政策效应评估中的局限以及未来方向:
首先,文章提到了机器学习在异质性政策效应评估中存在的局限。第一,机器学习算法的可接受性问题。机器学习算法的运行过程往往缺乏可解释性,这可能导致其结论难以被接受。第二,机器学习过程的可检验性问题。机器学习的过程往往依赖于数据驱动,这可能导致其结论难以被检验。第三,机器学习结论的稳健性问题。机器学习的方法往往缺乏统计特性,这可能导致其结论的稳健性较差。
接下来,文章提出了机器学习在异质性政策效应评估中的未来方向。第一,引入和发展机器学习方法,同时重视异质性政策效应评估的政策价值,并提高机器学习的可接受性。第二,结合传统分析范式,拓展机器学习在异质性政策效应评估中的新模式。第三,规范研究数据的采集和处理,推动数据和代码的公开透明。
总的来说,虽然机器学习在异质性政策效应评估中具有优势,但也存在一定的局限。未来的研究需要进一步发展和完善机器学习的方法,同时也要注意结合传统的方法,以实现更好的政策效应评估。
6. 结论:
主要对全文进行了总结,并强调了大数据时代下,机器学习方法可以拓展异质性政策效应评估的适用边界,但也带来了新的挑战,需要传统方法和机器学习形成互补关系。
首先,文章提到大数据时代的到来为政策效应评估提供了全新的素材,但同时也带来了新的挑战。传统的统计方法在处理高维、非结构化的大数据时,将面临“维度诅咒”的问题。而机器学习方法,如决策树、支持向量机等,可以有效地处理这些问题,拓展了异质性政策效应评估的适用边界。
其次,文章强调了虽然机器学习方法在处理大数据方面具有优势,但也带来了新的挑战。例如,机器学习算法的可接受性问题、过程的可检验性问题和结论的稳健性问题。因此,我们需要在发展机器学习的同时,也要关注这些问题,提高机器学习的可接受性、过程的可检验性和结论的稳健性。
最后,文章提出在大数据时代,我们需要将传统的统计方法与机器学习方法结合起来,形成互补关系。传统的统计方法具有理论基础,可以提供因果关系的解释,而机器学习方法具有处理大数据的能力,可以提供精细化的评估。只有将两者结合起来,才能更好地进行政策效应评估。
星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
欢迎扫描👇二维码添加关注